查看原文
其他

智能全局搜索,我们做了个本地模型,并且开源了!

deepin 深度操作系统 2023-12-28

在这个信息爆炸的时代,我们常常陷入数据的海洋中,无从下手。各种数据和文件散落在各个角落,想要找到特定的信息常常需要花费大量的时间和精力。现在,随着deepin全局搜索接入AI,我们能够在海量的数据中快速精准地定位到所需的信息,从而极大地提高信息检索效率。
接入AI后的全局搜索,具备两大核心亮点功能:自然语言搜索和图片内的文字搜索,能够为用户提供更加便捷、准确、实用的搜索体验。
自然语言搜索功能可以帮助用户通过自然语言形式输入关键词,从而快速地搜索到所需内容;而图片内的文字搜索功能则是一种创新性的搜索方式,用户可以在图片中查找关键词或短语,无需手动输入文本信息,为用户提供更加便捷、准确、实用的搜索体验。

自然语言搜索

功能特点
智能全局搜索支持强大的自然语言搜索功能,这意味着你可以用自然的语言描述你想要检索的信息,而不需要使用特定的关键词。
使用场景
  • 模糊搜索:当你无法记住准确的搜索关键词,只知道你需要找的内容的模糊描述时,可以将模糊描述输入给智能全局搜索,它会帮你找到答案。

  • 问题解答:你可以用自然语言描述本地文档中涉及的相关问题,智能全局搜索会找到包含相关答案的文档。

图片内文字搜索

功能特点
智能全局搜索能够识别图片中的文字,并将其转化为可搜索的文本。这意味着你可以直接搜索图片中的文字,即可找到这张图片。
该功能不仅适用于学习和工作,也可以帮助你在旅行中快速搜索景点信息、菜谱等等。
使用场景
  • 学习研究:你可以拍摄教科书或论文中的文字,存档下来,通过智能全局搜索,即可快速搜索相关资料,提高学习效率。

  • 旅行探索:在旅行中拍摄的大量照片,你通过搜索景点介绍牌上的文字,即可快速找到想要的景点图片。

  • 高效办公:你可以搜索截图中的内容,快速找到截图的信息;可以搜索身份证、扫描图片上的信息,快速定位需要的图片文件。

本地模型是如何实现的?

以上的AI能力,均是基于本地模型实现。基于国际知名的开源预训练模型,我们开发出本地模型内置于全局搜索,体量更小、占用算力更少,性能也更稳定。
对于自然语言搜索能力,是通过内置的自然语言解析的AI模型实现,该模型能较好地解析自然语言,理解用户搜索意图,然后在文件管理器中,找到最符合用户意图的文件。
后续我们将进一步提高用户意图预测的准确性,并提升搜索的性能表现。同时,还会扩大可搜索的范围(如:搜索不限于文件标题,文件内容也可以搜索),实现“万物皆可搜”的目标。
对于图片文本内容搜索,是通过内置的OCR识别的AI模型实现,该模型能较好地识别图片中的文本信息,使得全局搜索可以搜索到相应的信息。
后续我们将持续优化识别精度、增加更多的识别语言。同时,我们也计划引入更多图片识别模型,如:图片内容识别。届时,用户可直接描述图片的画面内容,即可搜索到对应的图片,如:帮我找一下我家小猫的图片。
同时,智能全局搜索应用已经开源,欢迎大家来共建,创造出更多好用的功能。
开源地址:
https://github.com/linuxdeepin/dde-grand-search

往期精选  |  Selection in the past



继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存